ลองนึกภาพว่าคุณกำลังออกแบบสะพานลอยในเมืองสมัยใหม่ แต่ละจุดแยกถนนเป็นการ 'แบ่งประเภท' และแต่ละช่วงทางเข้า-ออกที่ต่อเนื่องกันเป็นขั้นตอน 'แบ่งตามลำดับ' หากสถิติแสดงให้เห็นว่าคนขับที่มีพื้นฐานเฉพาะบางกลุ่มมีแนวโน้มเลือกเส้นทางใดเส้นทางหนึ่งมากกว่า เราจะเข้าสู่โลกของการวิเคราะห์ความสัมพันธ์ ซึ่งการเปลี่ยนจากแค่การ 'นับ' ไปสู่การหา 'รูปแบบ' นี้ คือแก่นของบทเรียนนี้: การขยายแนวคิดการนับเชิงไม่ต่อเนื่องไปสู่การพิสูจน์เชิงพีชคณิตอย่างเข้มงวดและการทดสอบทางสถิติ
เครื่องมือหลัก: วิธีแทนค่าและความแม่นยำทางตรรกะ
เมื่อจัดการกับการกระจายตัวของพหุนามสองพจน์วิธีแทนค่าคือกุญแจสำคัญที่แปลงสมการเอกลักษณ์ให้กลายเป็นความสัมพันธ์เชิงตัวเลข โดยการแทนค่าเฉพาะเจาะจง เช่น $1, -1, 0$ เราสามารถกำจัดพจน์เชิงคอมบิเนชันที่ซับซ้อนได้อย่างรวดเร็ว และดึงคุณสมบัติทางสถิติของสัมประสิทธิ์ออกมาได้ทันที
อย่างไรก็ตาม การนับไม่ได้มีประโยชน์เพียงแค่ในพีชคณิตเท่านั้น ในแบบจำลองจริงโมเดลการถดถอยเชิงเส้นแบบหนึ่งตัวแปรและการตรวจสอบความเป็นอิสระคือเครื่องมือสำคัญในการจัดการกับข้อมูลแบบจำแนกประเภท ตัวแรกสำรวจความสัมพันธ์แนวโน้มระหว่างตัวแปร ตัวหลังใช้ตารางสรุปขนาด $2 \times 2$ เพื่อประเมินว่าปรากฏการณ์สองประเภทมีความเป็นอิสระทางสถิติหรือไม่
โมเดลการถดถอยเชิงเส้นแบบหนึ่งตัวแปรคือสมการทางคณิตศาสตร์ที่อธิบายความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว รูปแบบคือ $y = bx + a + e$ โดยที่ $e$ คือข้อผิดพลาดสุ่ม
$$K^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}$$